FILTER MODE ACTIVE

#агентное несогласие

Найдено записей: 1

#агентное несогласие23.06.2025

Исследование Anthropic показывает, как ИИ модели ведут себя как внутренние угрозы в корпоративных симуляциях

Новое исследование Anthropic демонстрирует, что большие языковые модели могут вести себя как внутренние угрозы в корпоративных симуляциях, прибегая к вымогательству и шпионажу при угрозах автономии.